Protein

Browse of TCMCG075C00066 protein

CDS


Accession Number	TCMCG075C00066
gbkey	CDS
Protein Id	XP_007046491.2
Location	join(240489..240614,240713..240764,240857..240904,241012..241166,241264..241321,241827..241884,242038..242130,242216..242381,242473..242488,242580..242800,243349..243418,243511..243573,243724..245145,245222..245300,245404..245513,245751..245824,245931..246128,246665..246709,246783..246836,246933..247039,247289..247337,247435..247494,247611..247683,248023..248108,248250..248423)
Gene	LOC18610643
GeneID	18610643
Organism	Theobroma cacao

Protein


Length	1218aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA341501
db_source	XM_007046429.2
Definition	PREDICTED: DNA mismatch repair protein MLH3 isoform X1 [Theobroma cacao]

EGGNOG-MAPPER Annotation


COG_category	L
Description	DNA mismatch repair protein
KEGG_TC	-
KEGG_Module	-
KEGG_Reaction	-
KEGG_rclass	-
BRITE	ko00000 [VIEW IN KEGG] ko00001 [VIEW IN KEGG] ko03400 [VIEW IN KEGG]
KEGG_ko	ko:K08739 [VIEW IN KEGG]
EC	-
KEGG_Pathway	ko03430 [VIEW IN KEGG] map03430 [VIEW IN KEGG]
GOs	GO:0000003 [VIEW IN EMBL-EBI] GO:0000228 [VIEW IN EMBL-EBI] GO:0000280 [VIEW IN EMBL-EBI] GO:0000793 [VIEW IN EMBL-EBI] GO:0000794 [VIEW IN EMBL-EBI] GO:0000795 [VIEW IN EMBL-EBI] GO:0003674 [VIEW IN EMBL-EBI] GO:0003676 [VIEW IN EMBL-EBI] GO:0003677 [VIEW IN EMBL-EBI] GO:0003697 [VIEW IN EMBL-EBI] GO:0003824 [VIEW IN EMBL-EBI] GO:0005488 [VIEW IN EMBL-EBI] GO:0005575 [VIEW IN EMBL-EBI] GO:0005622 [VIEW IN EMBL-EBI] GO:0005623 [VIEW IN EMBL-EBI] GO:0005634 [VIEW IN EMBL-EBI] GO:0005694 [VIEW IN EMBL-EBI] GO:0005712 [VIEW IN EMBL-EBI] GO:0006139 [VIEW IN EMBL-EBI] GO:0006259 [VIEW IN EMBL-EBI] GO:0006281 [VIEW IN EMBL-EBI] GO:0006298 [VIEW IN EMBL-EBI] GO:0006310 [VIEW IN EMBL-EBI] GO:0006725 [VIEW IN EMBL-EBI] GO:0006807 [VIEW IN EMBL-EBI] GO:0006950 [VIEW IN EMBL-EBI] GO:0006974 [VIEW IN EMBL-EBI] GO:0006996 [VIEW IN EMBL-EBI] GO:0007049 [VIEW IN EMBL-EBI] GO:0007127 [VIEW IN EMBL-EBI] GO:0007131 [VIEW IN EMBL-EBI] GO:0008150 [VIEW IN EMBL-EBI] GO:0008152 [VIEW IN EMBL-EBI] GO:0009987 [VIEW IN EMBL-EBI] GO:0016043 [VIEW IN EMBL-EBI] GO:0016462 [VIEW IN EMBL-EBI] GO:0016787 [VIEW IN EMBL-EBI] GO:0016817 [VIEW IN EMBL-EBI] GO:0016818 [VIEW IN EMBL-EBI] GO:0016887 [VIEW IN EMBL-EBI] GO:0017111 [VIEW IN EMBL-EBI] GO:0022402 [VIEW IN EMBL-EBI] GO:0022414 [VIEW IN EMBL-EBI] GO:0031974 [VIEW IN EMBL-EBI] GO:0031981 [VIEW IN EMBL-EBI] GO:0032300 [VIEW IN EMBL-EBI] GO:0032991 [VIEW IN EMBL-EBI] GO:0033554 [VIEW IN EMBL-EBI] GO:0034641 [VIEW IN EMBL-EBI] GO:0035825 [VIEW IN EMBL-EBI] GO:0043170 [VIEW IN EMBL-EBI] GO:0043226 [VIEW IN EMBL-EBI] GO:0043227 [VIEW IN EMBL-EBI] GO:0043228 [VIEW IN EMBL-EBI] GO:0043229 [VIEW IN EMBL-EBI] GO:0043231 [VIEW IN EMBL-EBI] GO:0043232 [VIEW IN EMBL-EBI] GO:0043233 [VIEW IN EMBL-EBI] GO:0044237 [VIEW IN EMBL-EBI] GO:0044238 [VIEW IN EMBL-EBI] GO:0044260 [VIEW IN EMBL-EBI] GO:0044422 [VIEW IN EMBL-EBI] GO:0044424 [VIEW IN EMBL-EBI] GO:0044427 [VIEW IN EMBL-EBI] GO:0044428 [VIEW IN EMBL-EBI] GO:0044446 [VIEW IN EMBL-EBI] GO:0044454 [VIEW IN EMBL-EBI] GO:0044464 [VIEW IN EMBL-EBI] GO:0046483 [VIEW IN EMBL-EBI] GO:0048285 [VIEW IN EMBL-EBI] GO:0050896 [VIEW IN EMBL-EBI] GO:0051321 [VIEW IN EMBL-EBI] GO:0051716 [VIEW IN EMBL-EBI] GO:0061982 [VIEW IN EMBL-EBI] GO:0070013 [VIEW IN EMBL-EBI] GO:0071704 [VIEW IN EMBL-EBI] GO:0071840 [VIEW IN EMBL-EBI] GO:0090304 [VIEW IN EMBL-EBI] GO:0097159 [VIEW IN EMBL-EBI] GO:0099086 [VIEW IN EMBL-EBI] GO:0140013 [VIEW IN EMBL-EBI] GO:1901360 [VIEW IN EMBL-EBI] GO:1901363 [VIEW IN EMBL-EBI] GO:1903046 [VIEW IN EMBL-EBI] GO:1990391 [VIEW IN EMBL-EBI]

Sequence

CDS:
ATGGGGAGCATTAAGCCCTTGCCAGAGGCTGTTCGTAGTTCGGTGCGTTCTGCCATTATATTGTTTGACTTGACTAGGGTTGTGGAGGAGCTCATTTTCAACAGCCTCGATGCTTCTGCTTCAAAGGTGTCAGTCTTTGTAAGTGTCGGGAGCAGCTATGTCAAAGTGGTGGATGATGGATCTGGTATATCTCGTGATGGATTGGTGTCACTGGGAGAAAGATATGTAACATCAAAGCTTTACCATCTGGGTGATTTGGATGCTGCCAGCAGGAGCTTTGGCTTTCGGGGAGAAGCACTGGCTTCTATATCTGATGTAGCCTTGGTGGAAATAATAACAAAAGCTTACGGAAAGCCAAATGGGTACCGCAAGGTCATTAAGGGATCCAAGTGTTTGTATCTTGGAATTGATGATGATAGGAAAGATGCAGGTACAACAGTTGTCGTGCGTGATTTATTTTACAACCAACCTGTTCGGAAGAAGCATATGCAATCCTGCCCTAAGAAGGTGTTGCACTCAGTTAAAAAGTGCGTATTCAGAATGGCCCTTGTGCACCCAATGGTTTACTTCAATGTGATTGATATTGAAAGTGAGGATGAGCTTCTCAGTACGCATCCTTCCTCTTCTCCTTTGTCACTTTTAATGAGTGGTTTTGGGATTGAGGACTGTACCTCTCTGCAGAAGCTGAATGCTGATGATGGTTCCCTCAAGCTTTCTGGCTACATAACTGGCTCCTGGGACAATTTTGCTGTTAAGGCCTTTCAATTTGTTTATATCAATTCAAGGTTTGTCTGCAAGGGTCCCATTCATAAGTTGCTGAACAACTTGGCCACTAGTTTTGAGTCTTTAGATTCAAAGAAGGCTAACAACTGGACCAAGAAAGGAAAGAGGAGTAGACCTCAAGTATTTCCGTCCTACATACTGAATATTAGTTGCCCTCCTTCTTTCTATGATTTAACCTTAGAACCATCAAAGACATATGTTGAATTCAAGGATTGGGCATCTATACTTACCTTAATTGAGAAGACAATTCAACACCTCTGGAGGAAAAATATTTGTCGTGCCAATGGATTAGGACAAGCTGAAACTTTGAAGGAAGATGACAATATCTTACATGTGGAAGAAGATTTTTTTGATGAAGGACCATCTGTGGACTCAGAATTTGCAACAAGGAAACGTTGGACTCAAAAATATCGGCCTTCTTCTTCATTAGAGAAGCTAACAACAGATCATTTGTTTCTTACAGACCATGAAGATATTCCATTTGAGGAGTGCCATGTGAATAATGCACAATTTAGAGATCAACAAAACAATATGAAATTTGTTCATTGGACTGACTATTCTTTTCAAAGTTGGGATGATTCCCTTGTCAAAGGCACATCCTCAGTATTTGAAAGGAGTGATTGTTGTCTTTTGACAACTAATAACAATTCTTTAGTTGAGGATTACTTCTTGGAAAATAGATTCACTGCTTCAGGAAGATCAAACTGTCATGTGAACAACAATGGTATATGTTCAAAGTTAGGTAATGCATCCGATGTGGTTGAGAGTGATGTGACCAATGGAACAGATAGGAACATATTTCCTTTTGATTATCATGAACATTACAATGACTCACAGTTCAGAAAGAATATCAGCAAGCCTTTTCTGCAAAGTTGCTCCTCCCAAAGAACCTTGCCACTTGACAGGGAGTTGGTTGAAAGTGAGAAAGGAATTGAACCACCAATGGATAGCTTTAAGACCAAAGCGAAGCAGGTTTGCTCAAATGAAAGGTTCAATATGCTGAAAACTGATTCCAGTGATCAGACCATGTGGCAGGATGGAGGACCATGCGGTCAAATTTATCCCAAACTTGTAAGTAAAGGTGGGATTGCTAGAGATTTGGATGTTCTAACAAGGGCTTCTGCCAAATCGTTCCTGTCATGTGGAGATGTCTCTATTGAAGAGAATGGCCTTCCATCTGATTCAGTCACACCAATAGAAAAAACTGGCTCTGGTCATCAGTCCTTAAGTTCTGAATGGTGTTCAGGAACCTCTAATCCCTTTGAGCAGTTCAGTTATAAAAATCCAATTGAAGGGTGCTTCAGATCTGAAGAAAGGACCAACTTTGGGCATTTCTCTGCTGGTGAAGATGAGGACTACCAATTTAGCTTTGACCTAATCTCAAGGAGCTCCAGCCAAGAAAAATGCATCTATGATTGTCCAAACACTGGACTAGAAATTGACTATGCCAAATCTAGTAGAGATTTTCATGGATTCCTTCAACAATACAATCTAAATCATACATTTTCTCCAGAAGATTCCAATGTAGCAATTGAAGAGAGAGACTGGTTGTGTACAGACTCAAGTATTAATGAATATAAAAGACAAATCGATTGGTTTCAATATCAAGATGTTGAACAAAATCCTATTCCTAAAGAAAGAGCAAGAAGAAGCCAGTCAGCTCCTCCATTTTGCAGCTACAAGAGGAGGTTTATCTCCTTACATCATTGTTTGGCATCAGGGGAACCCACTTTTAGTGAAGTCCGTGGTCCATTCACTTCTCCAGAGATTGGTGAGAAGAAGCCTCCCCAACAATCTTCTGGTGTGGACAATCTACATTTTGAACCAAGTTTTGGAAAGAATAGATCAAATATGAATAACAAGCCAAACATGGTGTTCAGCACTGTAGTTCGAAAATGTGAAGACATTGAACAACCTCATTGCCTAGAGGGTCCTGAATCAGCTCCGGTGCAAGTATTTATCTCAAAGGGAAATCAGGATCCAGCAAATTCTGGAACCAAATGGCGGAGTGGTTTTGCACAGAATACAAGCAACAGCAAATTATGTGATATTGACTATGAATATAATGTACTTGACATTGCGTCCGGATTGCCCTTTGTTGCCACTAAATCATTGGTTCCTGAATCTATCAATAAGAATTGTCTCAGAGATGCCAAGGTTCTGCAACAGGTGGATAAGAAATTCATCCCAATTGTAGCTGGCGGAACACTTGCTATTATTGATCAGCATGCGGCAGATGAAAGAATTCAACTAGAAGAACTTCGACAAAAGGTTTTATCTGGGAAAGGGAAGACAGTCACCTATTTGGATACAGAGCAAGAGCTGATCCTGCCAGAGATTGGCTATCAGTTACTGCACAATTATTCTGAACAAATAAGAAATTGGGGTTGGATCTGTGACATTCACACCCAAGATTCAAAGCCCTTCAAGAAGAATTTGAACCTTATTCGTCGTAAGCCGGCTGTTGTCAAACTTCTTGCAGTACCTTGCATTTTAGGTGTCAATTTATCTCATGTTGATCTCCTGGAATTTCTACAACAGCTTGCTGATACAGATGGATCATCAACAATGCCTCCATCAATTATTCGAATTCTTAATTCTAAAGCATGCAGAGGTGCAATTATGTTTGGAGACTCCTTGCTACCTTCAGAATGTTCCTTAATTGTTGAAGAGCTGAAGCAGACGTCCCTGTGCTTCCAATGTGCTCATGGGCGACCAACCACTGTCCCGGTTGTGAAGTTGGAGGCATTGCATAGGCAGATAGCTAAAATGCAAATGAAGGATGGTGGTCCAAGGGAATTGTGGCACGGGCTATGTCGACACAGAGTCAGCCTTGAACGAGCCAGCTTGCGCTTAAGTGCAGCTGGAGGTTAG

Protein:
MGSIKPLPEAVRSSVRSAIILFDLTRVVEELIFNSLDASASKVSVFVSVGSSYVKVVDDGSGISRDGLVSLGERYVTSKLYHLGDLDAASRSFGFRGEALASISDVALVEIITKAYGKPNGYRKVIKGSKCLYLGIDDDRKDAGTTVVVRDLFYNQPVRKKHMQSCPKKVLHSVKKCVFRMALVHPMVYFNVIDIESEDELLSTHPSSSPLSLLMSGFGIEDCTSLQKLNADDGSLKLSGYITGSWDNFAVKAFQFVYINSRFVCKGPIHKLLNNLATSFESLDSKKANNWTKKGKRSRPQVFPSYILNISCPPSFYDLTLEPSKTYVEFKDWASILTLIEKTIQHLWRKNICRANGLGQAETLKEDDNILHVEEDFFDEGPSVDSEFATRKRWTQKYRPSSSLEKLTTDHLFLTDHEDIPFEECHVNNAQFRDQQNNMKFVHWTDYSFQSWDDSLVKGTSSVFERSDCCLLTTNNNSLVEDYFLENRFTASGRSNCHVNNNGICSKLGNASDVVESDVTNGTDRNIFPFDYHEHYNDSQFRKNISKPFLQSCSSQRTLPLDRELVESEKGIEPPMDSFKTKAKQVCSNERFNMLKTDSSDQTMWQDGGPCGQIYPKLVSKGGIARDLDVLTRASAKSFLSCGDVSIEENGLPSDSVTPIEKTGSGHQSLSSEWCSGTSNPFEQFSYKNPIEGCFRSEERTNFGHFSAGEDEDYQFSFDLISRSSSQEKCIYDCPNTGLEIDYAKSSRDFHGFLQQYNLNHTFSPEDSNVAIEERDWLCTDSSINEYKRQIDWFQYQDVEQNPIPKERARRSQSAPPFCSYKRRFISLHHCLASGEPTFSEVRGPFTSPEIGEKKPPQQSSGVDNLHFEPSFGKNRSNMNNKPNMVFSTVVRKCEDIEQPHCLEGPESAPVQVFISKGNQDPANSGTKWRSGFAQNTSNSKLCDIDYEYNVLDIASGLPFVATKSLVPESINKNCLRDAKVLQQVDKKFIPIVAGGTLAIIDQHAADERIQLEELRQKVLSGKGKTVTYLDTEQELILPEIGYQLLHNYSEQIRNWGWICDIHTQDSKPFKKNLNLIRRKPAVVKLLAVPCILGVNLSHVDLLEFLQQLADTDGSSTMPPSIIRILNSKACRGAIMFGDSLLPSECSLIVEELKQTSLCFQCAHGRPTTVPVVKLEALHRQIAKMQMKDGGPRELWHGLCRHRVSLERASLRLSAAGG

Browse of TCMCG075C00066 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence